人才招聘

联系方式

联系人:周老师

电话:0755-88015667

Email:stat-ds@sustech.edu.cn

南方科技大学统计与数据科学系——大数据创新中心招募多模态大模型算法及Infra方向研究型实习生

单位介绍

南方科技大学统计与数据科学系成立于2019年4月,以建设国际一流的教育培养和研究基地为目的。本系志在为国家培养出具有扎实的科学基础,思想活跃,创新意识和能力强,有国际视野,脚踏实地,有朝气、有理想的拔尖人才。本系已经建立起本硕博人才培养体系,拥有统计学和数据科学与大数据技术两个本科专业,及数学学科下概率论和数理统计硕博学位授予权,主要研究领域包括数理统计、生物医学统计、金融统计和数据科学。本系目前共有17位教研序列教师和4位双聘教师,其中有讲席教授3人,教授4人,副教授5人,助理教授9人。 


荆炳义教授,现任南方科技大学统计与数据科学系副系主任、讲席教授、南方科技大学大数据创新主任。于1993年在悉尼大学获得统计学博士学位,1992-1994 年在澳洲国立大学做博士后,师从国际著名统计学家Peter Hall 教授。1994-2021年在香港科技大学工作,任数学系教授、统计科学中心主任。荆炳义研究兴趣广泛,包括概率论与数理统计,金融计量及高频数据分析,机器学习理论与算法,生物信息,网络数据分析,强化学习等。他在各领域中有许多开创性研究,取得了很多突破性科研成果。共发表论文100余篇。荆炳义教授荣获2015年度国家自然科学奖二等奖, 教育部长江学者讲座教授,及两年度(2010,2015)获教育部高等学校自然科学奖二等奖。荆炳义教授是美国统计协会(ASA)和数理统计协会(IMS)会士(Fellow),国际统计学会(ISI)当选会士,泛华统计协会理事会成员,并先后分别担任七家国际期刊副主编。更多详细信息请参考学术主页:https://faculty.sustech.edu.cn/?tagid=jingby&iscss=1&snapid=1&orderby=date&go=1


目前,大数据创新中心专注于自然语言处理、多模态理解与生成、大规模多模态模型训练与推理Infra、大模型驱动具身智能等方向的研究工作,与粤港澳大湾区数字经济研究院、UCloud等多家研究单位、企业开展合作。


2023年12月初,荆炳义教授课题组联合IDEA研究院发布34B Chat模型,具备超强多轮对话能力,在由美国Hugging Face社区支持的、致力于追踪、排名和评估大语言模型性能的开放大语言模型排行榜(Open LLM Leaderboard)中占据榜首,同时登顶上海AILab发布的Opencompass榜单同规模模型榜首,成为目前最具优势的开源34B指令微调模型之一。https://newshub.sustech.edu.cn/html/202312/44629.html



实习岗位信息

岗位一:多模态大模型算法实习生


岗位职责

1. 负责研究和开发多模态大模型与世界模型,包括语言、图像、视频等模态融合,图像与视频生成,视频动作与空间关系理解等;

2. 进行多模态大模型的数据处理、分布式训练、调优、验证和部署;

3. 跟踪最新的学术论文和技术发展,积极产出高水平的研究成果。


能力要求

1. 计算机科学与技术、机器学习和人工智能等相关专业在读学生;

2. 熟练掌握主流深度学习框架,如TensorFlow、PyTorch,并具备良好的编程能力;

3. 对NLP/CV/多模态领域的经典模型(如GPT、VIT、LLaVA等)有深入理解,熟悉相关任务和评测方法;

4. 具备良好的逻辑思维、沟通协作能力和学习能力,能够独立解决问题;

5. 熟悉英文技术文献的阅读和撰写,具备一定的研究能力和学术影响力者优先考虑;

6. 熟悉分布式训练框架,如Megatron、DeepSpeed,并具备多机多卡大模型训练经验者优先考虑;

7. ACM等程序设计比赛、自然语言处理/多模态相关顶级会议论文或比赛获奖经历者优先;

8. 具有技术热情及技术信仰,较强的学习能力。


岗位二:大模型Infra实习生


岗位职责

1. 参与大模型分布式训练框架、推理框架的设计与研发;

2. 参与多模态大模型分布式训练,多卡推理框架等底层组件的抽象与设计,包括训练框架优化,分布式网络优化等;


能力要求

1. 熟练掌握Linux环境下的C/C++与Python语言;

2. 熟练掌握至少一种机器学习框架(Tensorflow / PyTorch / Jax 或其他自研框架)并熟悉设计思路及工作原理;

3. 有以下至少一项的背景知识与经验:cuda编程,NCCL,编译器,高性能网络,并行计算,集群调度;

4. 熟悉 S3, PostgreSQL, Karfka, Apache Flink 等大数据分布式处理技术者优先;

5. 熟悉 DeepSpeed、MegatronLM 等分布式训练框架者优先;

6. 有软硬件联合设计的经验,能使用数学工具分析深度学习训练中的优化算法优先;

7. 有大模型训练推理调优经验优先。



薪资待遇

日薪350~500元(可覆盖在深生活开销,租房约1500元),根据候选人的经验和技能水平确定。


平台资源

1、可为实习生提供南科大丰富优质的图书馆资源,AI和交叉学科领域拥有雄厚的师资力量;

2、实习期间中心提供计算资源、舒适的办公环境用于科学研究;

3、可参与课题组科研项目,并可作为论文合作者;

4、合适者可以支持留组深造、或推荐境外机会;

5、与华为、IDEA、鹏程实验室等有深度合作,也可提供内推机会;

6、深圳拥有宽松自由的创新创业环境,是粤港澳大湾区的核心城市之一,毗邻香港、澳门,地理位置优越,学生实习期间可深刻感受“深圳速度”;



简历投递

邮箱:data@sustech.edu.cn

电话:0755-88015665


加入我们,您将有机会在AI领域的前沿技术上工作,与一流的研究学者共同解决挑战,推动技术进步。我们期待您的加入!